Analyse natürlicher Sprache
Veranstaltung |
Wochentag |
Termin |
Ort |
- |
Dienstag |
10.00 - 12.00 |
R. U 331 Emil Figge Str. 50 |
040269 |
Dienstag |
16.00 - 18.00 |
OH14, Raum E02 Campus Nord |
040269 |
Mittwoch |
16.00 - 18.00 |
OH14, Raum E02 Campus Nord |
Inhalt
Eine Fülle von Daten liegt in Form natürlicher Sprache vor und eine Vielzahl von Methoden und Werkzeugen gibt es, mit diesen unstrukturierten Daten umzugehen. Das Fachprojekt soll es den Teilnehmern ermöglichen, sich innerhalb eines Themenkomplexes sowohl auf theoretischer als auch praktischer Ebene zu orientieren. Es werden vier Themen bearbeitet, jedes in einer Gruppe:
- Textklassifikation mit SVMs
- Kernel Methoden
- Annotationen durch Experten aus der Linguistik
- Feature Extraction
- Implementierung eines Klassifikators in RapidMiner
Zu einem Thema gehören Grundlagentexte, Tools und weiterführende Texte. Ein Anwendungsbeispiel stammt aus der Germanistik. Neben den wissenschaftlichen Tätigkeiten werden auch Softskills in den Gruppen eingeübt.
Alle Studenten haben die Einführungen zu SVMs und Kernel Methoden durchzuarbeiten. Ab der zweiten Veranstaltungswoche werden Kentnisse darüber vorrausgesetzt.
Weitere Details können Sie
hier finden.
In der Veranstaltung wird es vier Vorträge geben, die jeweils durch eine Gruppe von vier bis fünf Studenten vorbereitet und gehalten werden. Folgende Themen steht zur Ausswahl:
- 1. Textklassifikation und String Kernels für SVMs
- 2. Tree Kernels und Approximation
- 3. RapidMiner, Textprocessing Plugin, OpenNLP und Stanford Parser
- 4. LibSVM in RapidMininer und userdefined Kernels. Hier müssen Sie sich den Quellcode von RapidMiner besorgen und die Stellen im Code untersuchen.
Weiter unten gibts es Links zu Literatur zu den einzelnen Vortragsthemen. Sie müssen eigenständig weitere Literatur
Hinweis: Registrien Sie sich auf
RapidMiner Homepage als Student und laden Sie die Community Version 5 runter. Diese enthäl alle Sourcen. Weiterhin benötigen Sie das Text Mining Plugin, welches Sie aus dem RapidMiner Help/Update RapidMiner raus installieren können.
Aktuelles
Am 18.3. um 14 Uhr und am 21.3 um 14 Uhr findet im Raum 1.48 beim LS8, Joseph-von-Fraunhofer-Strasse 23, 1. Etage, die Vorstellung der Themen und Anwendungen bezogen auf das Fachprojekt. AnschlieÃend werden die Gruppen festgelegt.
Weitere Literatur:
Einführungvorträge
Beispieldaten